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Die Erfindung betrifft eine Recheneinheit fiir eine programmierbare Logikeinheit, die im 
folgenden als Prozessor Oder iVIikrocontroiler bezeichnet wird. Die Recheneinheit eriaubt 
dem programmierbaren Rechenkern mit relativ geringem zusatzlichen Hardware-Aufwand 
neben den eigentlichen Steuerungsaufgaben auch digitale Signalverarbeitung zu 
betreiben, obgleich der Prozessor im wesentlichen fiir Steuerungsaufgaben ausgelegt ist. 
In der digitalen Signalverarbeitung werden haufig Multiplikationen mit anschliessender 
Akkumulierung vorausgehender Ergebnisse benotigt, beispielsweise bei der Realisierung 
unterschiedlichster digitaler Filter, bei denen digitalisierte Signalwerte verandert oder aus 
digitalisierten Signalwerten eine Signaleigenschaft herausgefiltert werden soli. Derartige 
digitale Filterstrukturen sind ausreichend bekannt. Die digitalisierten Signalwerte 
aufeinanderfolgender Abtastzeitpunkte werden dabei mit unterschiedlichen Zahlenwerten 
multipliziert und die einzelnen Produkte summiert. Die resuitierende Summe wird 
entweder weiten/erarbeitet oder stellt schon einen aktuellen Filtererausgangswert dar. Die 
unterschiedlichen Zahlenwerte mit denen die digitalisierten Signalwerte multipliziert 
werden entsprechen Koeffizienten, die durch die jeweitigen Filtereigenschaften 
vorgegeben sind. Damit die Filter auch bei hohen Signalfrequenzen im Echtzeitbetrieb 
arbeiten konnen, muB fur die ubiichen Signalmultiplizierer entweder eine noch erhebllch 
hohere Taktfrequenz gewahit werden oder eine zeitlich gestaffelte Parallelverarbeitung (= 
Pipeline-Verfahren) oder bei einer noch weitergehenden Parallelverarbeitung ein hoher 
Hardwareaufwand, der in der Lage ist, eine echte Mulitiplikation innerhalb weniger 
Taktzyklen oder gar innerhalb einer einzigen Taktperiode auszufuhren. 

Es ist daher Aufgabe der Erfindung. eine Recheneinheit fur eine programmierbare 
Logikeinheit anzugeben, die eine schnelle Multiplikation ohne die oben beschriebenen 
Nachteile ermoglicht. 

Die Erfindung geht von der Erkenntnis aus, daB fiir die vorgesehene Anwendung der 
Recheneinheit als Multiplizierer, insbesondere bei der Realisierung von digitalen Filtern, 
unter bestimmten Voraussetzungen Vereinfachungen moglich sind. Werden namlich nur 
solche Zahlen fur die Filterkoeffizienten zugelassen, die sich relativ einfach als einfacher 
Zweierpotenzwert oder als einfache Summe und/oder Differenz von Zweierpotenzwerten 
darstellen lassen, dann kann die Hardware-Struktur des Multiplizierers sehr vereinfacht 
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werden. Einfache Darstellungen in Zweierpotenzform sind beispielsweise alle binar 
kodierten Dualzahlen, die nur eine, zwei Oder drei Binarstellen beliebiger Ordnung 
aufweisen. Die Multiplikation kann dann lediglich durch ein bzw. zwei bzw. drei 
Stellenverschiebe- Oder Stellenzuordnungsoperationen mit einer bzw. zwei bzw. drei 
Stellenschiebeeinrichtungen (=Barrel-Schieberegister) und anschlieRender stellenrichtiger 
Addition der stellenverschobenen Bits ersetzt werden. Dabel mussen fur den 
Schiebevorgang nicht einmal alle Zwischenpositionen anwahlbar sein. Treten 
beispielsweise niemals die Zweierpotenzen 2exp3 (=2^) und 2exp5 (=2^) bei der 
Zahlenauswahl auf, dann erubrigen sich die Schiebepositionen um drei und funf 
Binarstellen. Die Eriauterung der Erfindung an Hand von binaren Dualzahlen schlieRt die 
Verwendung anderer Zahlensysteme, beispielsweise auf der Basis von ternaren Zahlen, 
selbstverstandlich nicht aus; in die Erfindung sind beliebige Zahlensysteme mit 
eingeschlossen. 

Damit die Beschrankung der zugelassenen Zahlenwerte oder Koeffizienten weniger 
storend ist, ist es von Vorteil, wenn auBer positiven Zweierpotenzen auch negative 
Zweierpotenzen zugelassen sind, die der kanonischen Darstellungsweise von binar 
kodierten Dualzahlen entsprechen. Dies erfordert lediglich eine Negierung des 
Zahlenwertes vor der Addition der Schiebeergebnisse. Die Negierung kann dabei vor 
Oder nach der Stellenschiebeeinrichtung erfolgen. Die Stellenverschiebung ist sowohl in 
Richtung groBerer als auch kleinerer Wertigkeiten moglich. Eine Schieberichtung in 
Richtung kleinerer Wertigkeiten entspricht einer Division um einen Zweierpotenzwert bzw. 
der Multiplikation mit einer reziproken Zweierpotenz. Da die Stellenschiebeeinrichtungen 
nach der Erfindung in der Regel nur wenige Schiebepositionen realisieren mussen, 
werden statt ubiichen Schieberegistern vorteilhafterweise logische Zuordnungsschaltun- 
gen venA^endet, die uber ein Schalternetzwerk die Stellen des zu multiplizierenden Daten- 
wortes mit den neuen Stellenpositionen verbinden. Schaltbefehle, die als Steuersignale 
Oder Instruktionen in Abhangigkeit von einem Steuerwort gebildet werden, steuern die 
verschiedenen Zuordnungsschalter. Dieses Verfahren ist wesentlich schneller als die 
Verwendung eines normalen Schieberegisters, das alle Zwischenpositionen durchlaufen 
muB. Ein weiterer Vorteil derartiger Zuordnungsschaltungen ist der relativ geringe 
Flachenbedarf bei der monolithischen Integration, denn die Speicher, die fur die 
Zwischenpositionen beim Schieberegister erforderlich sind, entfallen. 
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Die Beschrankung des Zahtenbereiches fur die Koeffizienten und damit die Reduktion der 
erforderlichen Stellenverschiebevorgange wird nun an einigen Beispielen aufgezeigt. Die 
Zahl 4 ist als Dualzahl mit einer einzigen Wertigkeit 2^ definiert, erfordert also nur eine 
einzige binare Stelle, namlich 2^ Die anderen Wertigkeiten 2^ und 2° haben den Wert 
5 Null. Dies entspricht einem einzigen Schiebevorgang der zu multiplizierenden Zahl um 
zwei Stellen. Ein Gegenbeispiel ist die Zahl 15, die als ubiiche Dualzahl 4 Binarstellen 
erfordert und als „1 1 1 1" dargestellt wird, namlich 2^+2^+2^2°. Dies erfordert vier 
unabhangige Schiebevorgange der zu multiplizierenden Zahl mit anschlieRender Addition 
der gleichen Wertigkeiten. In kanonischer Schreibweise erfordert die Zahl 15 jedoch nur 

10 zwei Binarstellen, namlich 2"^- 2*^. Dies sind nur noch zwei Schiebevorgange, einer um 4 
Stellen und ein zweiter um 0 Stellen, wobei der letzere Wert durch das negative 
Vorzeichen vom ersten Schiebeergebnis abgezogen wird. Ein weiteres Zahlenbeispiel, 
das dem iiblichen Wertebereich von 0 bis 1 oder von -1 bis +1 in Signalprozessoren 
entspricht, ist der Wert 0.234375 = 2 - 2 Die Multiplikation dieses Zahlenwertes mit 

1 5 der Zahl „a" hat dann die einfache Losung a-2 - a-2 ^, also wieder zwei 

Schiebevorgange um 2 und um 6 Stellen in Richtung kleinerer Wertigkeiten, dann die 
Negierung des einen Wertes und anschlieBend werden die Ergebnisse beider 
Schiebevorgange addiert. 



20 Die resultierende Summe stellt das Multiplikationsergebnis dar, das in einem Register 
gespeichert wird. Uber eine Signalruckfuhrung des Registerinhaltes auf den Addierer 
kann eine Akkumulierung durchgeftihrt werden, die bei Filteranwendungen oft notig ist. 
Selbstverstandlich ist die multiplizierende Eigenschaft derartiger Recheneinrichtungen 
nicht nur fur Filter, sondern auch fur andere Anwendungen mit Vorteil verwendbar, 

25 beispielsweise zur linearen Verstarkung oder Absenkung von Signalen, wenn eine 
einfache Stellenverschiebung zu grob ist. 

Alle Werte, die sich so auf diese relativ einfache Weise darstellen lassen, bilden einen 
Zahlenvorrat fur die moglichen Koeffizienten. Fur die jeweilige Anwendung sind nun die 
30 geeigneten Koeffizienten uber eine Simulation und Optimierung herauszufinden. Der 
Aufwand hierfur spielt keine Rolle, denn wenn die Koeffizienten einmal festliegen, dann 
brauchen diese Werte nicht mehr geandert zu werden und konnen in einem Speicher 
abgelegt werden. Ob es sich dabei um Filterkoeffizienten oder andere Werte handeit, ist 
fur die Erfindung nicht von Bedeutung. Ob die einzelnen Funktionsablaufe wie 
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Stellenverschiebung, Negierung und Addition innerhalb einer einzigen Taktperiode als 
abschlieRende Funktionsablaufe Oder zeitlich gestaffelt im Pipeliningverfahren uber 
mindestens zwei Taktperioden erfolgen, ist von untergeordneter Bedeutung. Es muB nur 
sichergestellt sein. daR alle erforderlichen Befehle immer rechtzeitig zur Verfugung 
5 stehen. In der Regel sind somit die erforderlichen Befehle oder Instruktionen in einem 
einzigen Befehlswort kodiert. 

Die Erfindung und vorteilhafte Anwendungen werden nun anhand der Figur der 
Zeichnung naher eriautert: 

10 




Die Figur zeigt ais Blockschaltbild schematisch eine Recheneinheit nach der Erfindung. 



In der einzigen Figur ist als Ausfuhrungsbeispiel das Blockschaltbild einer Recheneinheit 
nach der Erfindung dargestellt. Eine zu muitiplizierende erste Zahl z, die beispielsweise 

15 voher durch Digitalisierung eines Signalwertes in einem nicht dargestellten Analog-Digital- 
Umsetzer gebildet wurde und jetzt in einem Register 1 mit w Binarstellen steht, soil mit 
einer zweiten Zahl k aus einer anderen Datenquelle 2 oder Speichereinrichtung 25 
multipliziert werden. Die zweite Datenquelle 2 ist beispielsweise Teil eines monolithisch 
integrierten Prozessors. Ein Systemtakt cl entstammt ebenfalls der zweiten Quelle 2 oder 

20 einem nicht dargestellten Taktgenerator. In der Speichereinrichtung 25, die mit der 
Datenquelle 2 und einer Steuereinrichtung 20 verkoppelt ist, konnen die zuvor 
eingelesenen oder gespeicherten Zahlen k in irgend einer aufbereiteten Form k* 
gespeichert und durch ein Steuerwort op aus der Datenquelle 2 oder Steuereinrichtung 
20 abrufbar sein. Bel den eigentlichen Zahlen k handelt es sich nicht um fein aufgeteilte 

25 Zahlenwerte wie bei den Signalwerten, die innerhalb des vorgegebenen Wertebereichs 
und der Auflosung jeden beliebigen Zwischenwert annehmen konnen, sondern um fest 
vorgegebene Zahlenwerte mit einer ganz kleinen Anzahl von Binarstellen. Wie bereits 
enwahnt, handelt es sich bei den zweiten Zahlen k um eine enge Auswahl von binar 
kodierten Dualzahlen, vorteilhafterweise auch in kanonischer Form. 

30 

Die zu reaiisierenden Rechenablaufe in der Recheneinheit, beispielsweise zur Bildung 
eines digitalen Filters, sind uber Steuenvorte op aus der zweiten Quelle 2 gesteuert. Das 
Steuerwort op erzeugt dabei mittels der Steuereinrichtung 20 und der gespeicherten 
zweiten Zahl k* in der Speichereinrichtung 25 innerhalb einer einzigen Taktperiode 




• 
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samtliche parallel erforderlichen Steuersignaie oder Instruktionen n1, n2, s1, s2, ak fur 
die einzelnen Funktionseinheiten, damit diese das Multiplikationsergebnis mO aus der 
ersten und zweiten Zahl z, k innerhalb dieser einen Taktperiode bilden konnen. Die 
wesentlichen Funktionseinheiten sind dabei Stellenschiebeeinrichtungen 3, 4. 
Vorzeicheninverter 5, 6 und ein vielstelliger Addierer 7 mit einem schaltbaren 
Akkumulierungspfad. Das dargestellte Ausfuhrungsbeispiel enthalt eine erste und zweite 
Stellenschiebeeinrichtung 3, 4. Wenn eine feinere Auflosung zu realisieren ist. dann sind 
weitere Stellenschiebeeinrichtungen vorzusehen, die im Ausfuhrungsbeispiel durch 
gestrichelte Linien angedeutet sind, 

Vor der ersten bzw. zweiten Stellenschiebeeinrichtung 3, 4 befindet sich im jeweiligen 
Datenpfad ein erster bzw. zweiter Vorzeicheninverter 5, 6 und danach der gemeinsame 
Addierer 7, der die einzelnen Ausgange der Stellenschiebeeinrichtungen 3, 4 
stellenrichtig addiert und als aktuellen Multiplikationswert mO an seinen w+v Ausgangen 
abgibt. 

Aus dem vorgegebenen Vorrat und Format der Zahlen k. k* ergibt sich, wieviele 
Schiebepositionen die Stellenschiebeeinrichtungen 3, 4 jeweils aufweisen mussen. Ferner 
ergibt sich die zugehorige maximale Schiebedistanz v1, v2 und die Schieberichtung. Aus 
der maximalen Schiebedistanz v fur alle Stellenschiebeeinrichtungen 3, 4 und der 
maximalen Stellenanzahl w der ersten Zahl z, ergibt sich im wesentlichen die 
Stellenanzahl w+v des Addierers 7 und eines nachgeschalteten Akkumulatorspeichers 8, 
an dessen Ausgang ein akkumulierter Multiplikationswert ma abgreifbar ist. Die 
erforderliche Ruckfuhrung des Akkumulatorinhaltes zum Addierer 7 erfolgt uber den 
bereits genannten Akkumulierungspfad, dessen Schaltzustand von einer 
Akkumullerungsinstruktion ak gesteuert ist, die Schalter 9 offnet Oder schlieRt. 

Die Negierung der ersten Zahl z uber die Vorzeicheninstruktionen n1 . n2 erfolgt fur 
diejenigen Zahlen k, k* die in der kanonischen Darstellung eine Binarstelle mit negativem 

5 2 

Wert enthalten - beispielsweise die Zahl k = 28 in der kanonischen Form k = 2 - 2 . Die 
der zweiten Stellenschiebeeinrichrichtung 4 zugefuhrte Zahl k wird demnach invertiert und 
um zwel Stellen in MSB-Richtung (=Most Significant Bit) verschoben. Fur die erste 
Stellenschiebeeinrichtung 3 findet keine Invertierung statt. die Verschiebung in MSB- 
Richtung betragt hier 5 Stellen. Diese Informationen werden als parallele Steuersignaie 
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Oder Instruktionen n1 , n2, s1 , s2 von dem taktweise zugehenden Steuerwort op 
ausgeldst. 

Wenn fCir eine Zahl k aus dem vorhandenen Zahlenvorrat nicht alle 
Stellenschiebeeinrichtungen s1, s2 benotigt werden, beispielsweise weil die Zahl k einer 
glatten Zweierpotenz 2" entspricht, dann ist nur eine einzige Stellenschiebeeinrichtung s1 
Oder s2 erforderlich und die anderen durfen keinen Beitrag liefern. Diese Nullsetzung 
Oder Nullposition wird innerhalb der Schiebeinstruktion si, s2 durch einen eigenen 
Zahlenwert Oder eine eigene Bitfolge kodiert. Wenn beispielsweise die Schiebeinstruktion 
s1 Oder s2 fur eine Stellenschiebeeinrichtung 3 bzw. 4 zwei Binarstellen umfaBt, dann 
konnen entweder vier unterschiedliche Schiebepositionen programmiert werden Oder drei 
unterschiedliche Schiebepositionen und eine Nullposition, beispielsweise die vier 
Schiebepositionen um 5, 3, 0 Oder -2 Stellen Oder die drei Schiebepositionen um 5, 3 
Oder 1 Stelle, dafur aber auch noch die Nullposition. 

Der vielstellige Addierer 7 kann sehr unterschiedlich ausgebildet sein, beispielsweise eine 
Baumstruktur nach Wallace, um auch den akkumulierten Wert ma innerhalb einer 
einzigen Taktperiode bilden zu konnen. Weniger aufwendige Addiererstrukturen 
benotigen dafiir zwei Oder mehr Taktperioden. Wenn in jeder Taktperiode ein 
Multiplikationsergebnis mO, ma vorliegen soli, zwischen Ein- und Ausgang jedoch einige 
Taktperioden gleichsam als Laufzeit zulassig sind, dann bietet sich fur den Addierer auch 
das bereits erwahnte Pipeline-Verfahren an. 
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1 . Recheneinheit fiir eine erste (z) und zweite (k, k*) Zahl mit 

- mindestens einer Stellenschiebeeinrichtung (3, 4), deren Schiebeposition mittels einer 
zugehorigen Schiebeinstruktion (s1, s2) in Abhangigkeit von der zweiten Zahl (k, k*) 
gesteuert ist und deren Stelleneingangen die nach Wertigkeiten geordneten Stellen der 
ersten Zahl (z), die in der Regel eine binar kodierte Dualzahl ist, zugefuhrt sind, 

- jeder Stellenschiebeeinrichtung (s1, s2) ist ein- oder ausgangseitig ein 
Vorzeicheninverter (5, 6) zugeordnet, der in Abhangigkeit von der zweiten Zahl (k,k*), die 
in der Regel eine binar kodierte Dualzahl unter Einbeziehung der kanonischen Form ist, 
mittels einer zugehorigen Vorzeicheninstruktion (n1, n2) gesteuert ist, 

- jede Stelle der Stellenschiebeeinrichtung (3, 4) ist ausgangsseitig mit jeweils einem 
Stelleneingang eines vielstelligen Addierers (7) verbunden, und 

- die Funktionsablaufe wie Stellenverschiebung, Negierung und Addition erfolgen als 
abschlieBende Funktionsablaufe innerhalb einer einzigen Taktperiode oder zeitlich 
gestaffelt im Pipeliningverfahren uber mindestens zwei Taktperioden. 

2. Recheneinheit nach Anspruch 1 , dadurch gekennzeichnet, daB die Anzahl der 
unabhangig voneinander steuerbaren Stellenschiebeeinrichtungen (3, 4) von der Auswahl 
der zweiten Zahl (k, k*) abhangig ist, namlich von der durch die Auswahl vorgegebene 
maximale Stellenanzahl der zweiten Zahl (k, k*), wobei die Stellen mit der Wertigkeit Null 
nicht in die zu berucksichtigende Stellenanzahl mit eingehen. 

3. Recheneinheit nach Anspruch 1 oder 2, dadurch gekennzeichnet, da3 in der 
Schiebeinstruktion (s1, s2) fur die jeweilige Stellenschiebeeinrichtung (3, 4) auch eine 
Schiebeposition definiert ist, bei der die Ausgange fiir den nachfolgenden Addierer (7) 
gesperrt oder auf einen Nullwert gesetzt sind. 



-8- 

C. Noeske 2x C-1755DE 

Sa 

29.Febr.2000 

4. Recheneinheit nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, da3 die 
Ausgangsstellen des Addierers (7) mit den Eingangen eines Akkumulierungsspeichers (8) 
verkoppelt sind. 



5 5. Recheneinheit nach Anspruch 4, dadurch gekennzeichnet, da3 eine 

Akkumulierungsinstruktion (ak) einen Datenpfad aktiviert, der die Stellenausgange des 
Akkumulierungsspeichers (8) stellenrichtig auf Addiereingange des Addierers (7) 
zuruckkoppelt. 

^ ^ 10 6. Recheneinheit nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daB die 
erste (z) und zweite Zahl (k, k*) binar kodierte Dualzahlen sind und daB die Multiplikation 
der ersten und zweiten Zahl (z bzw. k, k*) durch aufeinanderfolgende Schiebevorgange 
einer einzigen Stellenschiebeeinrichtung (3) erfolgt, wobei die jeweiligen 
Schiebepositionen in Abhangigkeit von den Wertigkeiten der zugehorigen Binarstellen der 
15 zweiten Zahl (k, k*) mitteis aufeinanderfolgender Schiebeinstruktionen (si) bestimmt sind. 

7. Recheneinheit nach Anspruch 6, dadurch gekennzeichnet, daB bei zwei und mehr 
vorhandenen Stellenschiebeeinrichtungen (3, 4) die aufeinanderfolgenden 
Schiebevorgange gruppenweise erfolgen, indem jeder Stellenschiebeeinrichtung (3, 4) je 
20 eine Binarstelle der zweiten Zahl (k, k*) zugeordnet ist, wobei die zugehorigen 

Binarstellen der zweiten Zahl durch aufeinanderfolgende Schiebeinstruktionen (s1 , s2) 
bestimmt sind. 



• 
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Zusammenfassung 



Recheneinheit fur eine erste (z) und zweite (k, k*) kodierte Zahl mit mindestens einer 
Stellenschiebeeinrichtung (3, 4), deren Schiebeposition mittels einer zugehorigen 
Schiebeinstruktion (s1 , s2) in Abhangigkeit von der zweiten Zahl (k, k*) gesteuert ist und 
deren Stelleneingangen die nach Wertigkeiten geordneten Stellen der ersten Zahl (z) 
zugefuhrt sind. Jeder Stellenschiebeeinrichtung (s1. s2) ist ein Vorzeicheninverter (5, 6) 
zugeordnet, dessen jeweiliger Zustand in Abhangigkeit von der zweiten Zahl (k, k*) 
mittels einer zugehorigen Vorzeicheninstruktion (n1 , n2) gesteuert ist und jede Stelle der 
Stellenschiebeeinrichtung (3, 4) ist ausgangsseitig mit je einem vielstelligen Addierer (7) 
verbunden. 

(zur Zusammenfassung: Figur) 
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